Análise resultados BPZ para amostra VALID DES

A ideia principal será analisar os resultados obtidos com o algoritmo BPZ (Bayesian Photometric Redshifts) após o cálculo fotométrico do redshift utilizando a amostra valid. A amostra consta com dados de observações de aproximadamente 5800 galáxias.

A pesquisa foi separada em três etapas:

  1. Primeira execução: entendendo o aloritmo para obter experiencia com os parâmetros default (magnitudes MAGAUTO)
  2. Segunda execução: rodando o algoritmo com filtros e parâmetros corrigidos (magnitudes MAGAUTO)
  3. Terceira execução: algoritmo executado com filtros ajustados e magnitude correta (magnitude MAGDETMODEL)
    • 3.1 sem banda u
    • 3.2 com banda u

Importante ressaltar que a MAGDETMODEL é calculada a partir do formato da galáxia que melhor se encaixa em um filtro que se chama SEXtractor para depois ser medido o fluxo para cada banda de acordo com o formato que se encaixa melhor. Enquanto a MAGAUTO é calculada apartir do fluxo da abertura elíptica dando a estimativa total da magnitude do objeto.


0 - Setup

Importando as principais bibliotecas utilizadas

1. Pimeira execução.

A primeira execução foi feita rodando o algoritmo com os valores padrão indicados pelo autor do código e em cima da MAGAUTO e seus respectivos valores de erro presentes na amostra.

1.1 - lendo o arquivo com os resultados do bpz


Definindo a funções auxiliares

Essas funções vão facilitar na hora de plotar outros resultados para cada tentativa.

Bias e Scatter

Aqui declaramos uma função para auxiliar para criar um plot que do resultado de redshift da spectroscopia vs o resultado obtido para fotometria pelo algoritmo.

A plotagem do gráfico de zspec e zb (z best) é importante, pois consegue-se observar, pela distribuição dos pontos, o bias e scatter do algoritmo com a amostra.

Sendo o bias um viés, que indica uma tendencia de desvio da linha vermelha, que no caso indica um cenário perfeito, onde o resultado do algoritmo para photoz é igual ao specz. E o scatter sendo a dispersão da nuvem de pontos.


1.2 - Analisando o resultado

Observações:

Aqui podemos ver como a nuvem de pontos fica deslocada para baixo da linha vermelha, pode-se então dizer que existe um BIAS negativo para essa amostra com as configurações default do algoritmo.


Distribuição do zspec e photoz

Aqui faremos uma função para ajudar a visualizar a distribuição dos resultados zspec em comparação ao photoz.

Weight - a pesagem é uma técnica que associa um peso para cada galáxia. Esse peso serve pra que quando se observar a distribuição da fotometria se chegue mais perto do exemplo real.

Observação:

Nesses dois gráficos podemos comparar como o a técnica de pesagem impacta nos gráficos, trazendo essa suavização nos pilares dos gráficos. Outro ponto bom de se observar é a comparação com o resultado do zspec e photoz, deixando claro a diferença nos resultados obtidos.

1.3 - Conclusão chegada

As configurações padrões que vem no algoritmo não são as mais indicadas para a amostra. Trazendo um bias mais abaixo do que encontrado nos resultados do artigo.

O próximo passo será corrigir essas configurações.


2. Segunda execução.

A segunda execução foi feita rodando o algoritmo ainda com a MAGAUTO porém as seguintes alterações foram feitas no algoritmo:

  1. PRIOR: alguma informação que ajuda a definir melhor o resultado.
    • de hdfn_gen (hubble deep field north) para cosmos_Laigle (utilizado na pesquisa)
  2. ZMAX: estabelece um limite máximo de valor a se obter para pz
    • de 10 para 2
  3. DZ: a resolução do redshift
    • de 0.05 para 0.01
  4. INTERP: numero de interpolação que o algoritmo fará para cada template
    • de 0 para 2
  5. FILTROS: em cada telescópio, usam-se filtros para cada coletar a luz em banda, e esses filtros tem uma curva de transmissividade, no caso, como estamos olhando os resultados da DECam mudamos para os filtros da DECam
    • do SDSS para os filtros da DECam em cada banda

2.1 - lendo o arquivo com os resultados do bpz

2.2 - Analisando o resultado

Observação:

Nessa segunda tentativa, podemos perceber uma melhora significatva em relação ao bias no resultado, ainda podemos ver que existe um scatter mais espalhado em relação ao primeiro resultado.

Observação:

Já se nota, comparando com o primeiro resultado obtido, uma melhora em relação ao photoz em comparação ao zspec.

2.3 - Conclusão chegada

As configurações ajustadas melhoraram significativamente os resultados que tivemos porém, ainda executamos calculando em cima da MAGAUTO, como o BPZ faz o cálculo do redshift em cima do tipo de galáxias, é mais interessante ser usado a MAGDETMODEL pois o cálculo das magnitudes variam de acordo com cada tipo de galáxia, assim, na hora de decidir o melhor redshift tem se um resultado mais fiel para os algoritmos de template-fitting.


CURIOSIDADE - Analisando pz por magnitude

A ideia é olhar como se comportam os resultados dos redshifts em relação a magnitude na banda principal escolhida banda_i. Para facilitar, vamos ler a amostra antes de rodar o algoritmo (contém os valores das magnitudes) e juntar com os resultados obtidos com o algoritmo.

definindo uma função para auxiliar a visualização da magnitude banda i vs pz

Se observa uma característica que chama bastante atenção e vale a pena dar uma olhada mais próxima a titulo de curiosidade. O bpz possui um output que dá a porcentagem do resultado estar correto, com isso vale a pena dar uma olhadinha nesse comportamento com base na magnitude.

ODDS: a probabilidade do resultado estar correto, valores baixos significam que há mais de um resultado.

Conforme esperado, quanto maior a magnitude maior a imprecisão do resultado de redshift fotométrico.

Bokeh

Bokeh é uma lib que ajuda a montar gráficos interativos. Aqui vai facilitar na coleta de pontos para serem vistos no target viewer.

Nesse caso nos interessa apenas a "cobrinha" formada, então vamos limitar os pontos para plotar dentro do gráfico interativo.

Target Viewer

Aqui consta algumas fotos analisadas no target viewer para vermos melhor alguns desses pontos.

Aqui é legal de observar como para cada linha temos imagens diferentes, algumas possuem maior ruido, que pode ser causado pelo clima, outras possuem interferência de objetos como telescópios, ou até mesmo em um conjunto de bandas capturam uma emissão que não aparecem nas demais.


3. Terceira execução.

A terceira execução foi feita utilizando a MAGDETMODEL, a ideia é comparar o resultado rodando em cima da amostra com banda u e sem a banda u. A banda u é importante para desempate de tipo de galáxia, e portanto traz uma maior precisão em valores baixos no cálculo do pz

3.1 - lendo o arquivo com os resultados do bpz

3.2 - Resultados

Observação:

Como podemos observar, houve a reprodução muito parecida com a do artigo, podendo notar como a primeira figura se assemelha ao formato de uma espada, sendo por conta da imprecisão do algoritmo ao decidir o melhor tipo espectral da galáxia. Já no segundo vemos que uma bainha desaparece, justamente por conter a banda u para desempatar possiveis galáxias encaixadas no algoritmo.

Observação:

A intenção aqui é perceber o impacto no resultado obtido em com e sem banda u em comparação do photoz calculado para o zspec já definido na amostra.

4 - Métricas

Nessa etapa a ideia é comparar o resultado de três métricas com os obtidos no paper.

BIAS: o viés que o algoritmo apresenta rodando a amostra.

MEDIAN: o valor encontrado na posição central de um conjunto.

SIGMA 68: o valor encontrado onde 68 porcentro dos valores ficam proximos a mediana.

FORMULAS

$\Delta z_i = z_{phot}, i − z_{spec}, i$

$BIAS = \overline{\Delta z} = \frac{\sum \Delta z_i}N$

$MEDIAN = \overline{\Delta z_{50}} = \frac{P_{50}}{2}$

$ SIGMA = σ_{68} = \frac{(P_{84} -P_{16})}{2}$

Observação:

Aqui a linha vermelha representa a nossa mediana. E é bom que esse gráfico mostra bastante, por exemplo, como a maioria dos dados se concentra no centro, e o sigma 68 representa no gráfico o valor médio de 68% dos dados nesse miolo com o centro sendo a mediana. Isso significa que, tendo a mediana no centro, 34% dos dados ficam a direita e 34% ficam a esquerda, concentrando a amostra perto da mediana.